智能论文笔记

A Heterogeneous In-Memory Computing Cluster For Flexible End-to-End Inference of Real-World Deep Neural Networks

Angelo Garofalo , Gianmarco Ottavi , Francesco Conti , Geethan Karunaratne , Irem Boybat , Luca Benini , Davide Rossi

分类：机器学习 | 神经与进化计算

2022-01-04

在小型电池约束的物流设备上部署现代TinyML任务需要高计算能效。使用非易失性存储器（NVM）的模拟内存计算（IMC）承诺在深神经网络（DNN）推理中的主要效率提高，并用作DNN权重的片上存储器存储器。然而，在系统级别尚未完全理解IMC的功能灵活性限制及其对性能，能量和面积效率的影响。为了目标实际的端到端的IOT应用程序，IMC阵列必须括在异构可编程系统中，引入我们旨在解决这项工作的新系统级挑战。我们介绍了一个非均相紧密的聚类架构，整合了8个RISC-V核心，内存计算加速器（IMA）和数字加速器。我们在高度异构的工作负载上基准测试，例如来自MobileNetv2的瓶颈层，显示出11.5倍的性能和9.5倍的能效改进，而在核心上高度优化并行执行相比。此外，我们通过将我们的异构架构缩放到多阵列加速器，探讨了在IMC阵列资源方面对全移动级DNN（MobileNetv2）的端到端推断的要求。我们的结果表明，我们的解决方案在MobileNetv2的端到端推断上，在执行延迟方面比现有的可编程架构更好，比最先进的异构解决方案更好的数量级集成内存计算模拟核心。

translated by 谷歌翻译

A Few Shot Multi-Representation Approach for N-gram Spotting in Historical Manuscripts

Giuseppe De Gregorio , Sanket Biswas , Mohamed Ali Souibgui , Asma Bensalah , Josep Lladós , Alicia Fornés , Angelo Marcelli

分类：计算机视觉

2022-09-21

尽管最近的自动文本识别取得了进步，但在历史手稿方面，该性能仍然保持温和。这主要是因为缺乏可用的标记数据来训练渴望数据的手写文本识别（HTR）模型。由于错误率的降低，关键字发现系统（KWS）提供了HTR的有效替代方案，但通常仅限于封闭的参考词汇。在本文中，我们提出了一些学习范式，用于发现几个字符（n-gram）的序列，这些序列需要少量标记的训练数据。我们表明，对重要的n-gram的认识可以减少系统对词汇的依赖。在这种情况下，输入手写线图像中的vocabulary（OOV）单词可能是属于词典的n-gram序列。对我们提出的多代表方法进行了广泛的实验评估。

translated by 谷歌翻译

Controller Synthesis for Timeline-based Games

Renato Acampora , Luca Geatti , Nicola Gigante , Angelo Montanari , Valentino Picotti

分类：人工智能

2022-09-21

在最初出生在太空行业的基于时间轴的计划方法中，一组状态变量（时间表）的演变受一组时间约束的控制。基于传统时间表的计划系统在整合计划与处理时间不确定性的执行方面表现出色。为了处理一般的非确定主义，最近引入了基于时间轴的游戏的概念。已经证明，发现此类游戏是否存在获胜策略是2Exptime-Complete。但是，缺少合成实施此类策略的控制器的具体方法。本文填补了这一空白，概述了基于时间轴游戏的控制器合成方法。

translated by 谷歌翻译

HandMime: Sign Language Fingerspelling Acquisition via Imitation Learning

Federico Tavella , Aphrodite Galata , Angelo Cangelosi

分类：机器人 | 自然语言处理 | 计算机视觉 | 机器学习

2022-09-12

学习细粒度的运动是机器人技术中最具挑战性的主题之一。这尤其是机器人手。机器人的手语获取或更具体地说，机器人中的手指手语获取可以被视为这种挑战的特定实例。在本文中，我们提出了一种从视频示例中学习灵巧的运动模仿的方法，而无需使用任何其他信息。我们为每个关节构建一个机器人手的乌尔德FF模型。通过利用预先训练的深视力模型，我们从RGB视频中提取手的3D姿势。然后，使用最新的强化学习算法进行运动模仿（即，近端政策优化），我们训练一项政策，以重现从演示中提取的运动。我们确定最佳的超参数集以基于参考运动执行模仿。此外，我们演示了我们的方法能够概括超过6个不同的手指字母的能力。

translated by 谷歌翻译

Spotting Virus from Satellites: Modeling the Circulation of West Nile Virus Through Graph Neural Networks

Lorenzo Bonicelli , Angelo Porrello , Stefano Vincenzi , Carla Ippoliti , Federica Iapaolo , Annamaria Conte , Simone Calderara

分类：计算机视觉 | 人工智能 | 机器学习

2022-09-07

西尼罗河病毒（WNV）的发生代表了最常见的蚊子传播的人畜共患病毒感染之一。它的循环通常与适合载体增殖和病毒复制的气候和环境条件有关。最重要的是，已经开发了几种统计模型来塑造和预测WNV循环：尤其是，最近的地球观察数据（EO）数据的巨大可用性，再加上人工智能领域的持续发展，提供了宝贵的机会。在本文中，我们试图通过用卫星图像为深度神经网络（DNN）喂食WNV循环，这些图像已被广泛证明可以具有环境和气候特征。值得注意的是，尽管以前的方法可以独立分析每个地理位置，但我们提出了一种空间感知方法，该方法也考虑了近距离位点的特征。具体而言，我们建立在图形神经网络（GNN）的基础上，以从相邻位置进行聚集特征，并进一步扩展这些模块以考虑多个关系，例如两个地点之间的温度和土壤水分差异以及地理距离。此外，我们将与时间相关的信息直接注入模型中，以考虑病毒传播的季节性。我们设计了一个实验环境，将卫星图像（来自Landsat和Sentinel任务）结合在一起，以及意大利WNV循环的地面真相观察。我们表明，与适当的预训练阶段配对时，我们提出的多种jaCencenciencencencence Graph注意网络（MAGAT）始终导致更高的性能。最后，我们在消融研究中评估MAGAT每个组成部分的重要性。

translated by 谷歌翻译

A first-order logic characterization of safety and co-safety languages

Alessandro Cimatti , Luca Geatti , Nicola Gigante , Angelo Montanari , Stefano Tonetta

分类：人工智能

2022-09-06

线性时间逻辑（LTL）是最受欢迎的时间逻辑之一，它在计算机科学的各种分支中发挥作用。在其广泛使用的各种原因中，它具有强大的基础特性：LTL等于无反欧米茄 - 自动疗法，与无星的欧米茄表达式，以及（通过Kamp的定理）与一个继任者的一阶理论（S1S [FO]）。安全性和共同安全性语言，其中有限的前缀足以确定单词是否不属于或属于该语言，在降低LTL的模型检查和反应性合成等问题的复杂性方面起着至关重要的作用。 safetyltl（分别，cosafetyltl）是LTL的片段，其中只允许通用（分别，存在的）时间方式，仅识别安全性（分别，共同安全）语言。本文的主要贡献是引入了S1S [FO]的片段，称为Safetyfo及其双Cosafetyfo，它们在LTL可定义的安全性和共同安全性语言方面表现出色。我们证明它们分别表征了Safetyltl和Cosafetyltl，这是加入Kamp定理的结果，并更清晰地看出了（片段）LTL的（片段）在一阶语言方面。此外，它提供了直接，紧凑且独立的证据，表明LTL中可以定义的任何安全语言在Safetyltl中也可以定义。作为副产品，我们获得了Safetyltl弱明天运营商的表达能力的一些有趣结果，该实力对有限和无限单词进行了解释。此外，我们证明，当用有限的单词解释时，Safetyltl（cosafetyltl）没有明天（分别，弱的明天）操作员捕获了LTL的安全性（分别，共同安全）片段，而不是有限词。

translated by 谷歌翻译

CASPER: Cognitive Architecture for Social Perception and Engagement in Robots

Samuele Vinanzi , Angelo Cangelosi

分类：机器人 | 人工智能

2022-09-01

我们的世界越来越被具有不同自治程度的智能机器人所笼罩。为了将自己无缝整合到我们的社会中，即使在没有人类的直接投入的情况下，这些机器也应具有导航日常工作复杂性的能力。换句话说，我们希望这些机器人了解其合作伙伴的意图，以预测帮助他们的最佳方法。在本文中，我们介绍了Casper（社会感知和在机器人中参与的认知体系结构）：一种象征性认知体系结构，使用定性的空间推理来预测另一个代理的追求目标并计算最佳的协作行为。这是通过平行过程的集合来执行的，该过程对低级动作识别和高级目标理解进行建模，这两者都经过正式验证。我们已经在模拟的厨房环境中测试了这种体系结构，我们收集的结果表明，机器人能够认识到一个持续的目标并适当合作实现其成就。这证明了对定性空间关系的新使用，该空间关系应用于人类机器人相互作用领域的意图阅读问题。

translated by 谷歌翻译

Consistency-based Self-supervised Learning for Temporal Anomaly Localization

Aniello Panariello , Angelo Porrello , Simone Calderara , Rita Cucchiara

分类：计算机视觉 | 人工智能

2022-08-10

这项工作解决了弱监督的异常检测，其中允许预测指标不仅可以从正常示例中学习，而且还可以从训练期间提供的一些标签异常。特别是，我们处理视频流中异常活动的本地化：这是一个非常具有挑战性的情况，因为培训示例仅带有视频级别的注释（而不是帧级）。最近的几项工作提出了各种正则化术语来解决它，即通过对弱学习的框架级异常得分的稀疏性和平滑度约束。在这项工作中，我们受到自我监督学习领域的最新进展的启发，并要求模型为同一视频序列的不同增强而产生相同的分数。我们表明，执行这种对齐能够提高模型在XD暴力方面的性能。

translated by 谷歌翻译

Governor: a Reference Generator for Nonlinear Model Predictive Control in Legged Robots

Angelo Bratta , Michele Focchi , Niraj Rathod , Mario Zanon , Alberto Bemporad , Claudio Semini

分类：机器人

2022-07-20

模型预测控制（MPC）方法被广泛用于机器人技术，因为它们允许在机器人移动时计算更新的轨迹。他们通常需要启发式参考，以进行跟踪术语和成本功能参数的正确调整，以便获得良好的性能。例如，当腿部机器人必须对环境的干扰（例如，推动后恢复）或以静态不稳定步态跟踪某个目标时，算法的有效性会降解。在这项工作中，我们提出了一个新型基于优化的参考生成器，名为州长，该发电机利用线性倒置的摆模型来计算质量中心的参考轨迹，同时考虑了步态的可能不足（例如，在小跑中）。获得的轨迹用作我们先前工作中提出的非线性MPC成本函数的参考[1]。我们还提出了一个公式，可以保证一定的响应时间达到目标，而无需调整成本条款的权重。此外，校正了立足点以将机器人朝目标推动。我们证明了在与Aliengo机器人不同情况下的模拟和实验中，我们的方法的有效性。

translated by 谷歌翻译

RV4JaCa -- Runtime Verification for Multi-Agent Systems

Debora C. Engelmann , Angelo Ferrando , Alison R. Panisson , Davide Ancona , Rafael H. Bordini , Viviana Mascardi

分类：人工智能

2022-07-20

本文使用JACAMO框架提供了多代理系统（MAS）的运行时验证（RV）方法。我们的目标是为MAS带来一层安全性。该层能够在系统执行过程中控制事件，而无需在每个代理的行为中进行特定的实现来识别事件。MAS已在混合智能的背景下使用。这种使用需要软件代理与人类之间的通信。在某些情况下，通过自然语言对话进行沟通。但是，这种沟通使我们引起了与控制对话流有关的关注，因此代理可以防止讨论主题的任何变化可能会损害其推理。我们证明了一个监视器的实施，该监视器旨在控制MAS中的对话流，该对话流通过自然语言与用户沟通以帮助医院病床分配的决策。

translated by 谷歌翻译